Model Selection

LibriSpeech optimized

# LibriSpeech optimized

Assignment1 Jack

A speech-to-text (S2T) model for automatic speech recognition (ASR), based on a sequence-to-sequence transformer architecture

Speech Recognition

Transformers English

Classroom-workshop

Assignment1 Jane

s2t-small-librispeech-asr is a speech-to-text (S2T) model for automatic speech recognition (ASR), based on a sequence-to-sequence transformer architecture.

Speech Recognition

Transformers English

Classroom-workshop

Wav2vec2 Large 960h Lv60 Self 4 Gram

Based on Facebook's Wav2Vec2-Large-960h-lv60-self model, enhanced with an English 4-gram language model to improve speech recognition accuracy

Speech Recognition English

patrickvonplaten

Wav2vec2 Base 960h 4 Gram

Based on Facebook's Wav2Vec2-Base-960h model, with an added English 4-gram language model to improve automatic speech recognition (ASR) accuracy.

Speech Recognition

Transformers English

patrickvonplaten

Wav2vec2 2 Bart Large No Adapter

This model is an automatic speech recognition (ASR) model trained on the LibriSpeech ASR dataset, capable of converting English speech into text.

Speech Recognition

S2t Medium Librispeech Asr

A speech-to-text (S2T) model for automatic speech recognition (ASR), based on a sequence-to-sequence transformer architecture

Speech Recognition

Transformers English

Wavlm Libri Clean 100h Base Plus

An automatic speech recognition model fine-tuned on the LIBRISPEECH_ASR - CLEAN dataset based on microsoft/wavlm-base-plus

Speech Recognition

patrickvonplaten

Wav2vec2 Base 960h

Wav2Vec2 is a self-supervised learning-based speech recognition model developed by Facebook, trained on the LibriSpeech dataset, supporting English speech-to-text tasks.

Speech Recognition

Transformers English

Wav2vec2 2 Bert Large No Adapter

An automatic speech recognition (ASR) model trained on the LibriSpeech dataset for converting English speech to text

Speech Recognition

S2t Large Librispeech Asr

An end-to-end sequence-to-sequence transformer model for automatic speech recognition (ASR), trained on the LibriSpeech dataset

Speech Recognition

Transformers English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase